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摘 要 : 针对 传统 协同 过 滤 算 法 所 面临 的 稀疏 性 及 预测 准确 度 不 高 的 问题 ， 提 出 一 种 基于 受 限 玻 尔 效 曼 机 与 加 权 
Slope One 的 混合 推荐 算法 。 首 先 通 过 受 限 玻 尔 座 曼 机 对 评分 纶 阵 的 初步 填充 , 缓解 数据 的 稀 足 性 问题 ; 然后 通过 一 
种 混合 项 目 相似 度 计 算 方法 ， 引 入 项 目 属性 信息 ; 最 后 通过 加 权 Slope One 算法 的 二 次 预测 ， 提 升 推荐 效果 。 在 
MovieLens100K 数据 集 上 的 实验 表明 ， 两 种 算法 的 结合 提高 了 推荐 的 准确 度 。 
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Research on hybrid recommendation algorithm of restricted 
Boltzmann machine and weighted Slope One 


Shen Xueli, He Chenhao, Meng Xiangfu 
(School of Electronic & Information Engineering, Liaoning Technical University, Huludao Liaoning 125105, China) 


Abstract: Aiming at the sparseness and low prediction accuracy of traditional collaborative filtering algorithms, this paper 
proposed a hybrid recommendation algorithm based on restricted Boltzmann machine and weighted Slope One. Firstly, it 
use the preliminary filling of the scoring matrix by the restricted Boltzmann machine to alleviate the sparseness problem of 
the data. Then, it introduced the project attribute information through a hybrid project similarity calculation method. Finally, 
it adopted the second prediction by the weighted Slope One algorithm to improve the recommended effect. Experiments on 
the MovieLens100K dataset show that the combination of the two algorithms increases the accuracy of the recommendation. 
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0 引言 中 91， 提 出 加 权 Slope One 算法 ， 有 效 解决 了 冷 启动 问题 
并 提高 了 预测 准确 度 。 

随 着 互联 网 技术 与 应 用 的 飞速 发 展 ， 人 类 开始 步 入 大 数 综 上 ， 本 文 将 对 以 上 两 种 模型 加 以 结合 及 改进 ， 提 出 
据 时 代 ， 面 对 越 来 越 繁杂 的 数据 量 ， 如 何 筛选 数据 成 为 了 网 。 种 基于 项 目的 实 值 受 限 玻 尔 兹 曼 机 与 加 权 Slope One 的 混合 
络 服务 提供 商 以 及 互联 网 用 户 的 共同 难题 。 个 性 化 推荐 系统 推荐 算法 (item-based real value RBM & wighted Slope One， 
便 是 一 种 主要 的 数据 筛选 的 途径 。 如 今 应 用 最 广泛 的 个 性 化 IR-RBM-WSO)。 
E 荐 方式 为 协同 过 滤 算 法 中， 而 将 两 种 协同 过 滤 算 法 相 结 合 Sa PE a 
的 混合 推荐 算法 如 今 成 为 协同 过 滤 算 法 的 一 个 重要 的 研究 方 ”1 ” 受 限 玻 尔 兹 曼 机 研究 现状 
向 叫 。 先 ， 假 设 在 一 个 推荐 系统 中 ,包含 mm 个 用 户 以 及 nm 个 
协同 过 滤 算 法 存在 着 数据 稀 疏 性 的 问题 。 即 在 实际 应 用 ”项 目 ， 用 户 对 项 目的 评分 为 1~k 间 的 整数 ， 由 此 可 建立 一 个 
中 ， 由 于 用 户 仅 为 少数 的 项 目 打分 ， 用 户 一 项 目 评分 矩阵 往 ”用 户 一 项 目 评分 矩阵 Res。 在 项 目 属性 信息 中 ， 包 含 s 个 项 
往 十 分 稀疏 ， 导 致 算法 的 推荐 准确 度 不 高 。 将 两 种 算法 相 结 目 分 类 属性 。 比 如 ， 在 MovieLens 数据 集中 就 提供 有 电影 的 
合 的 混合 推荐 算法 可 以 很 好 地 缓解 这 一 问题 .Slope One 算法 ”18 种 分 类 信息 。 每 一 个 项 目 属于 其 中 一 种 或 多 种 ， 是 否 属于 
是 一 种 常见 的 基于 用 户 的 协同 过 滤 算 法 ， 该 算法 具有 简洁 高 。 某 种 分 类 分 别 用 1 与 0 表示 。 由 此 可 建立 项 目 一 属性 矩阵 Txs。 
效 等 特点 ,能 充分 考虑 到 评分 矩阵 中 用 户 间 与 项 目 间 的 联系 ， 下 文 将 基于 此 例 对 算法 进行 说 明 。 
在 数据 稠密 时 可 取得 较 其 他 传统 协同 过 滤 算 法 更 好 的 推荐 结 受 限 玻 尔 兹 曼 机 (RBM) 是 一 种 具有 两 层 结 构 的 神经 网 
果 叫 。 但 在 数据 稀 朴 时 推荐 效果 不 理想 。 针 对 此 问题 ， 研 究 。” 络 模型 ， 可见 层 表示 评分 数据 ， 隐 层 作为 特征 提取 器 提取 数 
者 提出 了 使 用 奇异 值 分 解 (SVD ) 等 方法 B-9， 对 评分 矩阵 中 ” 据 间 特征 U9。 特点 为 屋内 无 连接 ， 层 间 全 连接 。2007 年 ， 
缺失 值 进行 填充 ， 再 通过 Slope One 算法 进行 预测 。 随 着 神 Salakhutdinov 等 人 中 首次 将 受 限 玻 尔 兹 曼 机 应 用 于 推荐 系统 
经 网 络 模型 在 协同 过 滤 中 的 应 用 ， 神 经 网 络 模型 较 传 统 协 同 中， 针对 推荐 系统 中 的 1~k 的 整数 评分 范围 ， 将 原始 RBM 
过 滤 算 法 ， 能 更 好 地 拟 合 数据 ， 深 层 挖 掘 数据 间 的 关系 。 受 ”模型 中 可 见 单元 从 二 值 变量 改变 为 一 个 含有 个 二 值 单元 的 
限 玻 尔 兹 曼 机 (RBM) 是 一 种 成 功 应 用 在 推荐 系统 中 的 神经 softmax 单元 。 此 模型 中 每 个 评分 均 需 要 k 个 单元 来 表示 , 使 
网 络 模 型 。 实 验证 明 ，RBM 模型 取得 了 优 于 SVD 等 模型 的 模型 参数 过 于 复杂 ， 训 练 时 间 较 长 。2013 年 ，Georgiev 等 人 
E 荐 效果 中 。 因 此 本 文 将 采用 受 限 玻 尔 兹 曼 机 对 评分 矩阵 加 5 提出 一 种 同时 基于 用 户 与 项 目的 RBM 模型 ， 并 将 评分 数 
以 填充 。 另 外 ， 研 究 者 将 相似 度 关 系 引 入 到 Slope One 算法 值 直接 应 用 在 可 见 层 。 该 模型 降低 了 算法 的 复杂 度 ， 但 可 解 
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释 性 较 差 。2015 年 ， 何 洁 月 等 人 忆 
交 信 息 引 入 到 模型 中 ， 缓 解 了 RBM 


光学 利 ， 竺 


ChinaXiv 合 作 期 刊 
第 37 卷 第 3 期 


沈 学 利 ， 等 : 受 限 玻 尔 座 曼 机 与 加 权 SlopeOne 的 混合 推荐 算法 研究 


在 实 值 RBM 基础 上 将 社 
的 数据 稀疏 性 问题 ， 提 


高 了 推荐 的 效果 ; 但 引入 的 社交 


信息 适用 范围 


交 信 息 的 稀 玻 性 问题 使 推荐 效果 


5 提出 一 种 基于 项 目的 RBM 模型 ， 


RBM 模型 的 推荐 效果 。 

本 文 将 在 利用 实 值 的 RBM 
建立 受 限 玻 尔 效 曼 机 模型 ， 提 出 
尔 兹 曼 机 模型 (IR_RBM )， 并 在 


不 够 理 


想 。2017 年 ， 霍 淑 华 


较 小 ， 并 且 社 


模型 基础 上 ， 


荐 系统 中 更 加 普遍 存在 


进 。 
2 ”本 文 算法 


取得 了 优 于 


一 种 基于 项 目的 实 值 受 限 玻 
相似 度 计算 过 程 中 引入 在 推 
的 项 目 属性 信息 来 对 预测 结果 加 以 改 


基于 用 户 


以 项 目的 角度 


本 文 提出 一 种 采用 实 值 形式 


模型 


的 基于 项 


受 限 玻 尔 兹 曼 机 
(item-based real value RBM，IR_RBM),， 结构 如 图 1 所 


示 。 对 每 一 个 项 目 均 建 立 

见 层 中 ,包含 m 个 数值 单元 , 用 

的 打分 。 可 见 层 节 点 数值 为 0~k 之 间 的 整数 ， 
用 户 未 对 该 项 目 打 分 ， 已 有 评分 用 实 值 表示 。 


User2 user3 


User1 


图 1 


Fig.1 


于 直接 使 


user4 


IR-RBM 模型 
IR-RBM model 
实 值 表 示 评 分 ， 在 原 RBM 能 量 模 型 基础 


上 加 入 一 个 二 次 方 项 ， 此 模型 的 


ZvicZhb, 
加 a 


ss 


可 见 单元 的 仿 
的 连接 权重 。 


元 的 激活 概率 为 


个 IR-RBM 模型 ， 每 个 模型 的 可 
于 表示 每 一 个 用 户 对 此 项 目 


其中 0 表示 此 


点 偏 置 ci 


user5 


能 量 计算 公式 为 
1 ， 好 之 

EQ,h|0) -52 -2 Why 
i il 产 


中 ; bj 为 第 j 个 隐 节 点 的 偏 置 ， 初 始 值 为 0094;， ai 为 第 i 个 
; Wi 为 第 i 个 可 见 单元 与 第 j 个 隐 单 元 之 间 
初始 化 为 满足 正 态 分 布 N 〈0,0.01) 的 随机 数 。 
根据 能 量 公 式 ， 则 当 评 分 数据 输入 模型 后 ， 第 j 个 隐 单 


plh; =1|v,0)=o(b, + 2 viW;) 


有 .OH 


当 隐 单元 的 状态 确定 时 ， 第 
ww=c+2， 


中 :Gr 为 激活 函数 ，o(x)=1/1+exp(~x) 。 


(1) 


(2) 


i 个 可 见 单 元 的 值 为 


hiWs 


参数 的 更 新 方式 使 
AWi = XA(vih ) 


data 


—(vihj),a0n) 


Aa; = A((v;) 0, — (Vi),0,) 
Ab = 4((h,),,, —(h,),,) 


ss 
™ 


(3) 


对 比 散 度 方法 ， 参 数 更 新 准则 为 


(4) 


: 4 为 学 习 率 。 本文 实验 通过 Adam 方法 来 更 新 学 习 率 ， 


以 加 快 模型 收敛 速率 。4 初始 值 设置 为 0.001053。 《()ew 为 一 


次 重 构 后 模型 定义 的 分 布 。 

建立 IR-RBM 模型 的 伪 代 码 见 算法 1。 
算法 1 基于 IR-RBM 模型 的 算法 的 伪 代 码 
IR-RBM 算法 伪 代 码 

输入 : 评分 矩阵 Rasn。 

输出 ， 利 用 IR-RBM 模型 填充 后 的 评分 矩阵 。 
建立 IR-RBM 模型 
1 fort= 1 :iteration DO: 

//iteration 为 I[R-RBM 迭代 次 数 ， 此 处 取 iteration 为 20 
2 fori=1:m DO: 
3 可 见 单元 状态 已 知 ， 利 用 式 (2〉 更 新 隐 单 元 状态 

4 隐 单 元 状态 已 知 ， 利 用 式 (3) 更 新 可 见 单元 的 值 

5 利用 式 (4) 更 新 参数 

6 end for 

7 end for 

8 for each Ri =0 in Rmin DO: 

9 利用 训练 好 的 人 迟 -RBM 为 预测 Ri 的 分 数 

10 end for 

相似 度 算法 

本 文 提 出 的 复合 相似 度 计 算 方法 ， 首 先 通 过 修正 余弦 相 
似 度 方法 计算 填充 后 的 评分 矩阵 中 项 目 间 相 似 度 ， 虽 然 此 方 


2.1 


法 可 以 较 好 地 挖掘 评分 矩阵 中 的 项 目 间 相 似 关 系 ， 但 其 忽略 
了 项 目 本 身 属 性 之 间 的 相似 关系 ， 在 实际 应 用 中 ， 用 户 往往 
会 对 同一 种 类 型 的 项 目 有 着 相似 的 喜好 程度 ， 并 给 出 相似 的 


打分 ; 其 次 基于 此 种 情况 ， 本 文 提出 一 种 
Jaccard 相似 度 08 计 算 方 法 , 挖掘 项 目 属 性 间 的 相似 关系 ， 
过 信息 粒 对 不 同 的 项 目 属性 赋予 不 同 的 权重 ， 再 采用 jaccard 
算法 计算 项 目 间 的 属性 相似 度 ; 最 后 将 项 目 评分 相似 度 及 项 
目 属性 相似 度 作 为 项 目 最 终 相 似 度 ， 将 其 作为 Slope One 算 
法 的 权 值 。 
2.1.1 修正 余弦 相似 度 算法 
修正 余弦 相似 度 是 在 余弦 相似 度 的 基础 上 ， 加 入 去 中 心 
化 思想 ， 通 过 减 去 平均 值 来 修正 不 同 用 户 的 评分 尺度 问题 。 


3 


由 合 信 息 灶 


亨 否 


基于 项 目的 修正 余弦 相似 度 计算 公式 如 式 〈5) 所 示 。 其 中 : 
R 表示 用 户 c 对 项 目 i 的 评分 ; RR 、R 表示 所 有 用 户 对 项 R。 
表示 用 户 c 对 项 目 i 的 评分 ， 久 、R 表示 所 有 用 户 对 项 目 i 
和 j 打分 的 平均 值 。 


i (Rs — RR,; —R)) 


simac(i,j)= 


修正 余弦 相似 度 的 取 值 为 [-1,1]。 考虑 到 本 文 将 会 使 用 此 
相似 度 作为 权 值 使 用 ， 故 需 将 其 映射 到 [0,1] 区 间 内 。 映 射 公 
式 如 式 (6) 所 示 。 


,+simacli,j 

Sim, (i, )) 二 

2.1.2 融合 信息 业 的 改进 Jaccard 相似 度 算 法 
Jaccard 相似 度 是 一 种 用 来 描述 两 个 集合 间 相 似 度 的 一 

种 方法 ， 适 用 于 高 度 离散 维度 特征 向 量 的 计算 409。 计算 公式 


Oa ， 其 中 A、B 为 两 个 mn 维 向 量 ， 所 有 维度 的 


[AuUB|’ 

取 值 为 1 或 0, 用 来 表示 是 否 包含 该 属性 。 式 中 分 子 表示 AB 
中 所 有 取 值 相同 的 维度 个 数 , 分 母 表示 AB 并 集 的 维度 个 数 。 
若 直接 将 其 应 用 到 推荐 系统 中 会 出 现 相 似 度 衡量 不 准确 


的 问题 。 针 对 单一 维度 来 说 ， 设 ai、bi 分 别 为 A、B 中 第 i 


为 7(4,B)= 


201901.00057V1 
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个 维度 的 取 值 ， 则 在 此 维度 4~m8 成 立 包 含有 两 种 情况 : ai、 
bi 同时 为 1，, 或 者 a、bi 同时 为 0。 即 Jaccard 认为 ai、bi 同时 
为 0 是 一 种 相似 的 情形 ， 但 考虑 到 推荐 系统 中 ai、bi 取 值 的 
实际 意义 为 : 项 目 A 与 B 均 不 属于 i 类 型 ,这 并 不 能 作为 两 
者 相似 的 依据 。 并 且 在 实际 的 数据 集中 ， 一 个 项 目 只 会 属于 
多 种 分 类 属性 中 的 少数 几 个 ， 即 ai、bi 同时 为 0 的 情况 会 大 
量 存在 。 比 如 ， 假 设 用 6 种 属性 来 划分 项 目 ， 其 中 项 目 A 仅 
属于 属性 1, 属性 向 量 为 {1,0,0,0,0,0}, 项 目 B 仅 属 于 属性 2， 
属性 向 量 为 {0,1,0,0,0,0}， 通 过 jaccard 系数 计算 得 出 的 相似 
度 为 66.7%， 但 从 实际 意义 考虑 ， 两 者 分 属 不 同 的 类 型 ， 可 
认为 相似 度 为 0。 

针对 此 问题 ， 本 文 将 对 Jaccard 相似 度 算法 进行 修改 ， 


对 于 单一 维度 ， 存在 四 种 可 能 情况 ， 分 别 为 : 
p: ai、bi 同 时 为 1 qd: bi 为 0; 


IT: 8 为 0 且 bi 为 1; ，s: ai、bi 同 时 为 0。 
轴 耻 良 本 由 本 后 条 于 作风 本 算法 只 
相似 情况 ， 则 A 与 B 的 相似 度 表示 为 


将 了 归 为 


Ia| 0) 


Ipl+lal+lrl+ls| 

其 中 : | 表示 符合 此 种 情况 维度 的 个 数 。 

2 ，Jaccard 相似 度 计算 中 ,每 种 属性 的 贡献 度 是 等 价 
的 ， 忽 略 了 不 同属 性 对 项 目 区 分 的 差异 性 。 比 如 ， 若 大 多 数 


Sim,; = 
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10 利用 式 (10) 计算 simitem (i,j) 

11 在 矩阵 $ 中 ， 更 新 Si=Si= simitem (i,j) 

12 end for 
2.2 加 权 Slope One 算法 

本 文 使 用 加 权 Slope One 算法 来 计算 最 终 的 预测 结果 。 
Slope One 算法 是 一 种 基于 线性 回归 思想 的 推荐 算法 , 由 偏差 
计算 公式 和 预测 公式 组 成 。 基 于 项 目的 偏差 计算 公式 如 下 


dW (11) 


其 中 : Rui 表 示 用 户 i 对 项 目 u 的 评分 ; Si 表示 同时 为 该 项 目 
打分 的 用 户 i 与 j 的 集合 。 由 于 本 文 使 用 的 为 填充 完整 的 评 
分 和 矩阵， 所 以 Si 在 这 里 等 于 用 户 集 M。 

融入 项 目 相 似 度 sm 六 的 Slope One 预测 公式 如 式 
(12) 所 示 。 


2 (条 * dev; ) x simien (i, 7) 
> js SiMiem (i, 万 


相似 度 选 出 的 相似 度 最 大 的 N 个 项 


prelu,i) = (12) 


中 : S(u) 表 示 通 过 项 


攻 从 - 
后 。 


算法 3 Slope One 预测 伪 代 码 
输入 : 评分 和 矩阵 Rm*n, 项 目 相 似 度 和 矩阵 Snn, | 户 鼻 


TI I 
浪 


hn 
7 
E 


(或 很 少 ) 的 项 目 属性 中 都 包含 属性 1， 那么 属性 i 对 项 目的 
区 分 度 就 会 很 低 ， 应 相对 降低 此 属性 的 权 值 。 针 对 此 问题 ， 
本 文 将 引入 信息 炉 来 对 不 同 的 属性 加 以 区 分 ， 信 息 炉 可 以 用 
来 量化 一 个 系统 的 混乱 程度 ， 对 于 0,1 的 二 元 值 情况 来 说 ,，0 
与 1 的 单元 个 数 差 值 越 大 ， 表 示 变 量 的 不 确定 性 越 小 ， 和 值 
越 小 ， 灶 值 越 低 ， 反 之 ， 差 值 越 小 ， 系 统 越 稳定 ， 灶 值 越 大 。 
对 用 户 一 属性 矩阵 的 每 一 列 ， 计 算 其 1 值 出 现 的 概率 ， 通 过 
言 息 灶 算 公 式 (8) 计算 此 项 目的 信息 炉 权 值 。 

H(Q)=-p(0;)xlog, p(0;)—(1—p(0;)) xlogs(1— p(0)) (8) 
其 中 :p (ai) 为 ai 值 为 1 的 概率 。 之 后 ， 通 过 信息 灼 权 值 来 
计算 两 个 项 目 间 的 相似 度 。 


综 上 ， 本 文 提 日 出 的 结合 信息 灼 改进 Jaccard 相似 度 计 
算 公式 为 
simj(i, j) = DH(0,) Nn, 


Zor Ho) 
2.1.3 项 目 综合 相似 度 算 法 

本 文采 用 两 种 相似 度 平均 值 作为 项 
式 如 〈10) 所 示 . 


间 相 似 度 。 计 算 公 


Sim, (i, )) + sim,(i, )) 


(10) 


Simiem(i, )) = 


算法 2 项 目 综合 相似 度 伪 代码 

输入 : 填充 后 的 评分 矩阵 Rmxn, 项 目 属性 矩阵 les。 项 目 
集 为 VY， 用 户 集 为 M， 属 性 集 为 P. 

输出 : 项 目 相似 度 和 矩阵 Suxn。 

Begin 

1 for each iin P DO: 

2 在 I 中 统计 pi 中 0 与 1 出现 概率 

3 利用 式 (8) 计算 pi 信息 灶 

4 end for 

5 for each jj in V (il=j) DO: 

6 在 R 中 取 列 向 量 Ri、 R; 

7 利用 式 (6) 计算 simn (Ri,Rj) 

8 在 P 中 ， 取 行 向 量 PE、Pi 

9 利用 式 (7) 计算 simn (pi,pj) 


定义 的 最 大 近邻 个 数 k， 需 评分 项 Rui。 
输出 : 预测 评分 pre(u,i)。 
Begin 
1S 中 取 列 向 量 Sw， 从 中 选取 K 个 相似 度 最 大 近邻 项 目 ， 

组 成 近邻 项 目 集合 S(u) 

2 for each u in S(u) DO: 

3 for each j in MQ!=i) DO: 

4 利用 式 (1~11) 求 devii 

5 end for 

6 利用 式 (1~12) 求 pre(u,i) 

7 end for 


3 ”实验 结果 及 分 析 


3.1 数据 集 及 评价 指标 

本 节 将 通过 实验 来 证 明 本 文 所 提出 算法 的 精确 度 ， 以 及 
模型 参数 对 实验 结果 的 影响 。 实验 采用 MovieLens100K 数据 
集中 的 用 户 一 项 目 评 分 信息 以 及 项 目 一 属性 信息 来 进行 实验 
验证 。 其 中 ， 用 户 一 项 目 评分 信息 


存放 在 u.data 文件 中 ， 包 
含 943 名 用 户 对 1 682 个 电影 的 十 万 条 评分 数据 :项目 一 属 
性 信息 存放 在 uitem 文件 中 , 包含 1 682 个 电影 的 属性 信息 ， 
实验 将 提取 其 中 的 18 个 电影 类 别 信 息 作为 项 目 一 属性 矩阵 。 
在 用 户 一 项 目 评分 中 ,抽取 20% 的 评分 数据 作为 测试 数据 集 。 
实验 使 用 平均 绝对 误差 (MAE) 及 均 方 根 误差 (RMSE) 
作为 评价 指标 。 
MAE 定义 如 式 (13) 所 示 。 
Yi | (13) 
N 


RMSE 定义 如 式 (14) 所 示 。 


RMSE = (14) 
3.2 ”实验 过 程 与 结果 分 析 
3.2.1 IR_RBM 模型 中 隐 单 元 数量 实验 
本 实验 将 建立 IR-RBM 模型 对 测试 集 进行 预测 ， 以 探究 


IR_RBM 中 隐身 


最 


iteration=80， 


从 图 中 可 知 ， 
MAE 值 呈 现 出 先 降 后 增 的 趋势 ， 
是 因为 


佳 隐 单元 数量 。 


元 数量 对 矩阵 填充 效果 的 影响 ， 并 确定 


实验 结果 如 医 


沈 学 利 ， 等 : 


定 一 个 


Hr ~ 


在 IR-RBM 模型 中 ， 使 
图 2 所 示 。 


用 训练 次 数 


0.92 [ 
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图 


Fig.2 MAE value of IR-RBM model with different 


number of 


hidden units 


100。 
3.2.2 IR-RBM 模型 训 
本 实验 将 探究 IR-RBM 模型 中 ，iteration 参数 对 矩阵 填 
充 效果 的 影响 ， 并 确定 一 个 最 佳 的 iteration 数值 。 实 验 结果 


如 


纵 坐 标 为 评价 


随 着 隐 单 元 数 


。 在 隐 单 元 数 
作为 特征 提取 功能 的 隐 单 元 数目 过 大 而 产生 了 过 拟 合 
现象 。 故 本 文 实验 中 IR-RBM 模型 中 的 隐 单 元 个 数 将 


的 增加 ，IR-RBM 模型 的 
在 隐 单 元 数量 取 值 100 时 ， 
大 于 100 时 推荐 效果 下 降 ， 


回 定 为 


练 集训 练 次 数 实 验 


图 3 所 示 。 图 中 横 坐 标 为 训练 集 在 民 -RBM 中 的 训练 次 数 ， 


指标 MAE 值 。 从 医 


图 中 可 以 发 现 ， 在 iteraiton 


值 大 于 20 时 ， 模 型 趋 于 收敛 ， 在 80 处 取得 最 佳 推荐 效果 。 
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10 


Fig.3 MAE value 


3 不 同 训练 次 数 下 了 下-RBM 模型 的 MAE 


50 60 70 80 
训练 次 数 


of IR-RBM model under different iteration 


3.2.3 最 近邻 居 数 目 K 对 推荐 效果 的 影响 


本 实验 将 建立 在 本 文 所 提出 的 IR-RBM-WSO 算法 ,而 
究 最 近邻 居 数 目 K 对 推荐 准确 度 的 影响 。 实 验 结果 如 图 4 所 
示 。 
图 可 见 ， 模 型 的 推荐 效果 随 着 近邻 数目 的 增加 呈现 出 
先 降低 而 后 稳定 的 趋势 。 由 于 模型 的 推荐 准确 率 在 近邻 数 
k>80 时 已 趋 于 稳定 ， 所 以 本 文 将 采用 k=80 作为 实验 参数 。 


3.2.4 本 文 相 关 算 法 对 比 实验 


的 


试 


成 算法 进行 对 比 ，j 


本 实验 将 建立 在 训练 次 数 iteration=80、 近 邻 个 数 k=80， 
情况 下 ， 对 本 文 所 提出 的 IR-RBM-WSO 算法 效果 与 其 组 


只 MAE、RMAE 


选取 了 以 下 四 
值 : 


组 模型 进行 对 比 ， 分 别 测 


a)Slope One 算法 


b) 基 于 本 文 相似 


度 的 加 权 Slope One 算法 (WSO)。 


受 限 玻 尔 诊 曼 机 与 加 权 SlopeOne 的 混合 推荐 算法 研究 


甘于 项 目的 受 限 玻 尔 兹 曼 机 模型 


d) 利 


j SVD 


进行 矩阵 填充 ， 并 采 


算法 进行 二 次 预测 的 算法 (SVD-WSO)。 


实验 结果 如 


图 5、6 所 示 。 
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Fig.4 MAE value of IR-RBM-WSO algorithm under different 
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图 5 相关 算法 对 比 实验 MAE 图 


Fig.5 Related algorithm comparison experiment MAE diagram 
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图 6 相关 算法 对 比 实验 RMSE 


图 


Fig.6 Related algorithm comparison experiment RMSE diagram 


分 析 两 图 中 数 扩 


推荐 准确 度 上 优 


果 得 到 了 一 定 的 
组 成 算法 LRBM 
10.71%, RMSE 

算法 相 结合 ， 


很 好 地 弥补 了 各 


与 
值 分 别提 升 了 


8.75% 与 12.63%， 
自 的 缺陷 , 提高 


E 问 


昌 可 得 以 下 结论 : 加 权 Slope One 算法 在 
于 原始 Slope One 算法 , MAE 与 RMSE 值 分 
别 较 后 者 提升 了 4.8% 与 8.3%， 说 明 本 文 相似 度 的 引入 在 一 
定 程度 上 缓解 了 Slope One 算法 的 数据 稀 玻 怕 
提升 ; IR-RBM-WSO 模型 的 
WSO 算法 , MAE 值 分 别 


题 ， 


E 荐 效果 
目 升 了 7 


说 明 


IR-RBM-WSO 较 SVD-WSO，MAE 与 RMSE 值 分 别 
3.89% 与 4.19%, 说 明 本 文 所 提出 的 仿 -RBM 模型 对 算 
的 效果 较 SVD 有 所 提高 。 


预测 准确 


推荐 效 
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3.2.5 3.2.5 本 文 算法 与 已 有 算法 对 比 实验 

为 了 进一步 验证 本 文 算 法 的 性 能 ， 将 本 实验 与 文献 [11] 
所 提出 的 UI-RBM 模型 以 及 文献 [17] 所 提出 的 基于 用 户 与 项 
目 ， 并 引入 属性 信息 层 的 IC-CRBMEF 模型 进行 对 比 ， 进 一 步 
验证 本 文 方案 的 性 能 。 实 验 结果 如 图 7 所 示 。 


一 8-IR-RBM-WSO 
0.76 上 下 一 米 -UPRBM 
\ 一 一 Hybrid IC-CRBMF Model 
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图 7 与 其 他 算法 对 比 实验 MAE 图 
Fig.7 Comparative experiment MAE figure with other algorithms 
实验 表明 , 在 本 数据 集 上 , IR-RBM-WSO 模型 的 推荐 效 
果 优 于 IC-CRBMEF 模型 ,最 佳 MAE 值 提升 了 3.8%; UI-RBM 
模型 收敛 速度 较 慢 ， 在 对 比 图 中 未 达到 最 优 效果 ， 推 荐 效果 
弱 于 本 文 算法 ， 在 iteration=500 时 ，MAE 值 收敛 在 0.690， 
仅 比 本 文 算法 低 0.002， 但 由 于 其 需 训练 次 数 较 高 ， 并 且 其 
模型 同时 对 用 户 及 项 目 建 模 ， 模 型 较 复杂 ， 所 以 本 文 算法 的 
训练 时 间 远 小 于 该 算法 。 


4 ”结束 语 


本 文 提出 一 种 混合 推荐 算法 ， 将 受 限 玻 尔 兹 曼 机 与 加 权 
Slope One 有 机 结合 在 一 起 。 通 过 受 限 玻 尔 兹 曼 机 对 和 矩阵 缺失 
值 的 填充 ， 缓 解 了 算 阵 稀疏 度 问 题 ， 通 过 Slope One 算法 进 
了 二 次 预测 ， 提 升 了 模型 的 推荐 效果 。 另 外 ， 通 过 一 种 复合 
相似 度 计算 方法 ， 挖 掘 项 目 属性 相似 度 ， 并 将 其 与 评分 相似 
度 相 结合 ， 更 好 地 反映 了 项 目 间 的 相似 关系 。 通 过 对 比 实验 
证 明 ， 本 文 提出 的 混合 推荐 算法 得 到 了 较 好 的 推荐 效果 。 但 
是 本 算法 并 不 能 很 好 地 解决 冷 启动 问题 ， 在 此 方面 的 改进 将 
是 下 一 步 的 工作 方向 ， 另 外 ， 将 对 深度 学 习 模型 进行 实验 
(8199， 以 进一步 提升 推荐 效果 。 
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